期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. Storm环境下基于权重的任务调度算法
鲁亮, 于炯, 卞琛, 英昌甜, 师康利, 蒲勇霖
计算机应用    2018, 38 (3): 699-706.   DOI: 10.11772/j.issn.1001-9081.2017082125
摘要560)      PDF (1385KB)(584)    收藏
大数据流式计算平台Apache Storm默认采用轮询的方式进行任务调度,未考虑到拓扑中各任务计算开销的差异以及任务之间不同类型的通信模式,在负载均衡和通信开销方面存在较大的优化空间。针对这一问题,提出一种Storm环境下基于权重的任务调度算法(TSAW-Storm)。该算法首先根据各任务的CPU资源占用情况以及任务间的数据流大小,分别确定拓扑的点权和边权;并利用最大化边权增益的思想,逐步构建起各工作节点中承载的任务集合,在保证集群负载均衡的同时,尽可能将边权较大的节点间数据流转化为节点内数据流,从而降低网络传输开销。实验结果表明,在包含有8个工作节点的WordCount基准测试中,TSAW-Storm的系统延迟和节点间数据流大小相比Storm默认调度算法分别降低了30.0%和32.9%,且各工作节点的CPU负载标准差仅为Storm默认调度算法的25.8%;此外,在与在线调度算法的对比实验中,TSAW-Storm在系统延迟、节点间数据流大小和CPU负载标准差方面分别降低了7.76%、11.8%和5.93%,且算法的执行开销明显降低,有效提高了Storm系统的运行效率。
参考文献 | 相关文章 | 多维度评价
2. 基于Hilbert-R树分级索引的时空查询算法
侯海耀, 钱育蓉, 英昌甜, 张晗, 卢学远, 赵燚
计算机应用    2018, 38 (10): 2869-2874.   DOI: 10.11772/j.issn.1001-9081.2018040749
摘要1025)      PDF (993KB)(334)    收藏
针对树形空间索引中多路查询及未考虑时间维索引的问题,提出一种结合时间和聚类结果的Hilbert-R树索引构建策略。首先,按照数据采集的周期划分时空数据集,并在此基础上建立时间索引,通过Hilbert曲线对空间数据进行分割编码,将空间坐标映射到一维区间;其次,依据数据要素在空间中的分布,采用动态确定 K值的聚类算法,结合聚类结果构建高效的Hilbert-R树空间索引;最后,基于Redis几种常见的键值数据结构,对时空数据的时间属性和聚类结果构建分级索引。在时空范围及目标矢量对象查询的实验中,与缓存敏感R+树(CCR+)相比,所提算法可有效减少时间开销,查询时间平均缩短约25%,对不同密集型数据具有良好的适应性,可更好地支持Redis应用于海量时空数据查询。
参考文献 | 相关文章 | 多维度评价
3. 基于迭代填充的内存计算框架分区映射算法
卞琛, 于炯, 修位蓉, 英昌甜, 钱育蓉
计算机应用    2017, 37 (3): 647-653.   DOI: 10.11772/j.issn.1001-9081.2017.03.647
摘要446)      PDF (1133KB)(382)    收藏
针对内存计算框架Spark在作业Shuffle阶段一次分区产生的数据倾斜问题,提出一种内存计算框架的迭代填充分区映射算法(IFPM)。首先,分析Spark作业的执行机制,建立作业效率模型和分区映射模型,给出作业执行时间和分配倾斜度的定义,证明这些定义与作业执行效率的因果逻辑关系;然后,根据模型和定义求解,设计扩展式数据分区算法(EPA)和迭代式分区映射算法(IMA),在Map端建立一对多分区函数,并通过分区函数将部分数据填入扩展区内,在数据分布局部感知后再执行扩展区迭代式的多轮数据分配,根据Reduce端已分配数据量建立适应性的扩展区映射规则,对原生区的数据倾斜进行逐步修正,以此保障数据分配的均衡性。实验结果表明,在不同源数据分布条件下,算法均提高了作业Shuffle过程分区映射合理性,缩减了宽依赖Stage的同步时间,提高了作业执行效率。
参考文献 | 相关文章 | 多维度评价
4. 基于内存云的大块数据对象并行存取策略
褚征, 于炯, 鲁亮, 英昌甜, 卞琛, 王跃飞
计算机应用    2016, 36 (6): 1526-1532.   DOI: 10.11772/j.issn.1001-9081.2016.06.1526
摘要550)      PDF (1195KB)(396)    收藏
由于内存云(RAMCloud)只支持最大1 MB的小块数据对象存储,因此当大于1 MB的对象需要存储在内存云集群中就会受到对象大小的限制,无法在集群中进行存储。为了解决内存云存储限制的问题,提出了基于内存云的大块数据对象并行存取策略。该存储策略首先将大块数据对象分割成若干个1 MB的小块数据对象,然后在客户端生成数据摘要,最后使用并行存储算法将客户端分割成的小块数据对象存储在内存云集群中。读取时首先读取数据摘要,然后根据数据摘要从内存云集群中并行读取小块数据对象,并将小块数据对象合并生成大块数据对象。实验结果表明:大块数据对象的并行存取策略在不破坏内存云集群体系结构的前提下存储时间为16~18 μs,读取时间为6~7 μs。在InfiniBand网络架构下,所提并行算法的加速比呈现类似线性的增长,它使大块数据对象也能够像小块数据对象一样在微秒级别下快速、高效地进行存取。
参考文献 | 相关文章 | 多维度评价
5. 分布式文件系统数据块聚类存储节能策略
王政英, 于炯, 英昌甜, 鲁亮
计算机应用    2015, 35 (2): 378-382.   DOI: 10.11772/j.issn.1001-9081.2015.02.0378
摘要470)      PDF (766KB)(384)    收藏

针对分布式文件系统中由于数据块随机放置而导致的服务器利用率低、能耗管理复杂的问题,建立了数据块访问特征向量模型描述用户对数据块的随机访问,运用K-means算法对数据块进行聚类计算,根据计算结果将数据节点划分为多个区域以存储不同聚类簇的数据块,在系统负载较低时进行数据块动态重配置,关闭不必要节点达到节能的目的。为使得策略适用于对能耗和资源利用率有不同要求的场景,算法中聚类簇间隔参数可灵活设置。实验通过和冷热区划分算法进行比较表明:按照聚类结果进行数据块重配置后,能耗节省效率优于冷热区划分算法,节省能耗35%~38%。

参考文献 | 相关文章 | 多维度评价
6. 内存云分级存储架构下的数据迁移模型
郭刚, 于炯, 鲁亮, 英昌甜, 尹路通
计算机应用    2015, 35 (12): 3392-3397.   DOI: 10.11772/j.issn.1001-9081.2015.12.3392
摘要466)      PDF (878KB)(352)    收藏
为了实现在线海量数据的高效存储与访问,在内存云分级存储架构下,提出一种基于数据重要性的迁移模型(MMDS)。首先,通过数据本身的大小、时间重要性、用户访问总量等因素对数据本身的重要性进行计算;其次,采用推荐系统中相似用户和PageRank算法中的重要性排名思想对数据的潜在价值进行评估,数据重要性和潜在价值共同决定了数据的重要程度;然后基于数据的重要性,设计了数据迁移机制。实验结果表明:该模型能够识别出数据的重要程度并分级放置数据,相比最近最少使用(LRU)、最近最不常用(LFU)、基于价值评估的数据迁移(MSDV)等算法,提高了存储系统的数据访问命中率。该模型能够缓解部分存储压力,数据访问性能也有了一定的提高。
参考文献 | 相关文章 | 多维度评价
7. 融合评论分析和隐语义模型的视频推荐算法
尹路通, 于炯, 鲁亮, 英昌甜, 郭刚
计算机应用    2015, 35 (11): 3247-3251.   DOI: 10.11772/j.issn.1001-9081.2015.11.3247
摘要438)      PDF (790KB)(565)    收藏
针对网络视频元数据信息缺失严重和多媒体数据本身特征难以提取等问题,提出了融合评论分析和隐语义模型的网络视频推荐算法.从视频评论入手,通过分析用户对不同视频的评论内容以判断其情感倾向并加以量化,继而构建用户对项目的虚拟评分矩阵,弥补了显式评分数据稀疏性问题.考虑到网络视频的多元性和高维度特性,为了深度挖掘用户对网络视频的潜在兴趣,针对虚拟评分矩阵采用隐语义模型(LFM)对网络视频分类,在传统的用户—项目二元推荐系统基础之上添加虚拟类目信息以进一步发掘用户—类目—项目关联关系.实验在多重标准下进行,对YouTube评论集的实验表明,所提推荐方法获得了较高的推荐精度.
参考文献 | 相关文章 | 多维度评价
8. 内存云架构的磁盘节能策略
鲁亮 于炯 英昌甜 王政英 刘建矿
计算机应用    2014, 34 (9): 2518-2522.   DOI: 10.11772/j.issn.1001-9081.2014.09.2518
摘要168)      PDF (777KB)(356)    收藏

内存云(RAMCloud)的出现改善了在线数据密集型(OLDI)应用的用户体验,但其能耗高于传统的云数据中心。针对该问题,提出一种适用于该架构的磁盘节能策略。首先,引入遗传算法中适应度函数和轮盘赌法,尽量选择更为节能的磁盘进行数据持久化备份;其次,设定合理的服务器内存缓冲区来延长磁盘的平均连续空闲时间,使得部分服务器磁盘在空闲时进入待机状态。仿真实验结果表明,在50台服务器的内存云系统中,该策略能有效节能约12.69%;而缓冲区大小的设定对于节能效果和数据可用性具有双重影响,需权衡考虑。

参考文献 | 相关文章 | 多维度评价
9. 基于用户访问特征的云存储副本动态管理节能策略
王政英 于炯 英昌甜 鲁亮 班爱琴
计算机应用    2014, 34 (8): 2256-2259.   DOI: 10.11772/j.issn.1001-9081.2014.08.2256
摘要314)      PDF (793KB)(504)    收藏

针对云计算环境下服务器利用率低、能耗浪费严重的问题,提出一种基于用户访问特征的云存储副本动态管理节能策略。通过把用户访问特征的研究转化为计算Block的访问热度,根据节点的整体访问热度,DataNode主动申请休眠从而达到节能的目的。给出了详细的休眠申请、休眠判断算法,以及在DataNode休眠期间出现对已休眠Block进行访问的情况时如何处理的解决方案。实验结果表明,采用该策略后可休眠29%~42%的DataNode,减少能耗31%,且服务器的用户响应时间不受影响。经过性能分析,得出该策略在保证数据可用性的同时可有效地降低能耗。

参考文献 | 相关文章 | 多维度评价
10. 基于小文件的内存云存储优化策略
英昌甜 于炯 鲁亮 刘建矿
计算机应用    2014, 34 (11): 3104-3108.   DOI: 10.11772/j.issn.1001-9081.2014.11.3104
摘要282)      PDF (782KB)(563)    收藏

由于内存云RAMCloud采用日志段的方式存储数据,因此当大量小文件存储于RAMCloud集群时,每个小文件独占整个段,会产生较多的段内碎片,从而导致内存的有效利用率较低以及大量的内存空间浪费。为了解决这个问题,提出基于文件分类的RAMCloud小文件存储优化策略。该策略首先根据文件的相关特性将小文件分为结构相关文件、逻辑相关文件以及相互独立文件三类;然后在存储时对结构相关的文件使用文件合并算法,逻辑相关和相互独立的小文件则使用分组算法。实验结果表明:同未进行优化的RAMCloud存储策略相比,该策略能有效提高集群内存利用率。

参考文献 | 相关文章 | 多维度评价
11. 云计算环境下多有向无环图工作流的节能调度算法
刘丹琦 于炯 英昌甜
计算机应用    2013, 33 (09): 2410-2415.   DOI: 10.11772/j.issn.1001-9081.2013.09.2428
摘要760)      PDF (846KB)(511)    收藏
针对多有向无环图(DAG)工作流节能调度算法中存在的节能效果不佳、适用范围较窄和无法兼顾性能优化等问题,提出了一种新的多DAG工作流节能调度方法——MREO。MREO在对计算密集型和通信密集型任务特点进行分析的基础上,通过整合独立任务,减少了处理器的数量,并利用回溯和分支限界算法对任务整合路径进行动态的优化选择,有效降低了整合算法的复杂度。实验结果证明,MREO在保证多DAG工作流性能的前提下,能够有效降低系统的计算和通信能量开销,获得了良好的节能效果。
相关文章 | 多维度评价